Corpus: kaz_wikipedia_2014_100K, 4.3.1.1 Most Frequent Sentence Beginnings I

Other corpora

Afrikaans
- News
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2007 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- South Africa
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
    - 2023 10K
    - 2023 30K
    - 2023 100K
    - 2023 300K
Albanian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Amharic
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Arabic
- News
  - 2005-2009 10K
  - 2005-2009 30K
  - 2005-2009 100K
  - 2005-2009 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Algeria
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Australia
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
- Bahrain
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2017 10K
    - 2017 30K
- COM
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Canada
  - Newscrawl-osian
- Egypt
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- France
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Germany
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Iran
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Iraq
  - Newscrawl-osian
- Jordan
  - Newscrawl-osian
- Lebanon
  - Newscrawl
- Mauritania
  - Newscrawl
    - 2012 10K
    - 2012 30K
- Morocco
  - Newscrawl
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Palestine
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Newscrawl-osian
- Qatar
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
- Russia
  - Newscrawl-osian
- Saudi Arabia
  - Newscrawl-osian
    - 2018 10K
- Sweden
  - Newscrawl-osian
- Syria
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Newscrawl-osian
- Tunisia
  - Newscrawl
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Turkey
  - Newscrawl-osian
- United Arab Emirates
  - News
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Newscrawl-osian
    - 2018 10K
    - 2018 30K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- United Kingdom
  - Newscrawl-osian
Aragonese
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Armenian
- News
  - 2019 10K
  - 2020 10K
  - 2020 30K
  - 2021 10K
  - 2021 30K
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Armenia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Assamese
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Asturian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Azerbaijani
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Balinese
- Wikipedia
  - 2021 10K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
Banjar
- Wikipedia
  - 2021 10K
- Indonesia
  - Web
    - 2015 10K
Bashkir
- News
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Basque
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
Bavarian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Belarusian
- News
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Belarus
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Bengali
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bangladesh
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Bihari
- Wikipedia
Bikol
- Wikipedia
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
Bishnupriya
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Bosnian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Breton
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Bulgarian
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Buriat
- Wikipedia
Catalan
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2004 10K
  - 2004 30K
  - 2004 100K
  - 2004 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Andorra
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- COM
  - Web
- European Union
  - Web
Cebuano
- Newscrawl
  - 2011 10K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Central Bikol
- Wikipedia
  - 2011 10K
  - 2014 10K
Central Kurdish
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Chechen
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Chinese
- News
  - 2007-2009 10K
  - 2007-2009 30K
  - 2007-2009 100K
  - 2007-2009 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- China, People's Republic of
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Macau
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- SIMP
  - News
    - 2009 10K
    - 2009 30K
    - 2009 100K
    - 2009 300K
    - 2010 10K
    - 2010 30K
    - 2010 100K
    - 2010 300K
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- TRAD
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
Chuvash
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Corsican
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Croatian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Croatia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Czech
- News
  - 2005 10K
  - 2005 30K
  - 2005-2007 10K
  - 2005-2007 30K
  - 2005-2007 100K
  - 2005-2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 30K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2014 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Danish
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Denmark
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
- Faroe Islands
  - Web
- Greenland
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Dhivehi
- News
  - 2019 10K
  - 2019 30K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Maldives
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Dimli
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Dotyali
- Wikipedia
  - 2018 10K
Dutch
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Aruba
  - Web
    - 2015 10K
    - 2017 10K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Netherlands Antilles
  - Web
    - 2013 10K
- Suriname
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Eastern Mari
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
Egyptian Arabic
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Emiliano-Romagnolo
- Wikipedia
  - 2016 10K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
English
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- American Samoa
  - Web
    - 2017 10K
    - 2017 30K
- Anguilla
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Antigua and Barbuda
  - Web
    - 2013 10K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Ascension
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Australia
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Bahamas, The
  - Web
- Barbados
  - Web
    - 2015 10K
    - 2015 30K
- Bermuda
  - Web
- Botswana
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- British Indian Ocean Territory
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Brunei
  - Web
    - 2015 10K
    - 2015 30K
- Canada
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Dominica
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2015 10K
    - 2015 30K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Falkland Islands (Islas Malvinas)
  - Web
    - 2017 10K
- Fiji
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Gambia, The
  - Web
- Germany
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Gibraltar
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guadeloupe
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guyana
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Ireland
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Kiribati
  - Web
    - 2013 10K
    - 2013 30K
- Montserrat
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
- Namibia
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Nauru
  - Web
    - 2015 10K
    - 2015 30K
- New Zealand
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Niue
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Philippines
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Puerto Rico
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
- Saint Kitts and Nevis
  - Web
    - 2013 10K
    - 2013 30K
- Saint Lucia
  - Web
- Saint Pierre and Miquelon
  - Web
    - 2016 10K
    - 2016 30K
- Saint Vincent and the Grenadines
  - Web
    - 2015 10K
    - 2016 10K
- Seychelles
  - Web
- Singapore
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- South Africa
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- South Georgia & South Sandwich Islands
  - Web
- Thailand
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Turks and Caicos Islands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- United Kingdom
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
- Zambia
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Zimbabwe
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Erzya
- Wikipedia
  - 2018 10K
  - 2021 10K
Esperanto
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
Estonian
- News
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Estonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
Extremaduran
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Faroese
- News
  - 2020 10K
  - 2020 30K
- Web
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Faroe Islands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Fiji Hindi
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Finnish
- News
  - 2005 10K
  - 2005 30K
  - 2005-2007 10K
  - 2005-2007 30K
  - 2005-2007 100K
  - 2005-2007 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
- Sweden
  - Web
    - 2020 10K
    - 2020 30K
French
- News
  - 2002-2005 10K
  - 2002-2005 30K
  - 2002-2005 100K
  - 2002-2005 300K
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2008 10K
  - 2005-2008 30K
  - 2005-2008 100K
  - 2005-2008 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl-public
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Belgium
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Benin
  - Web
    - 2013 10K
    - 2015 10K
    - 2017 10K
    - 2017 30K
- Burkina Faso
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Burundi
  - Web
    - 2015 10K
    - 2015 30K
- Cameroon
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Canada
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Congo, (Congo & Kinshasa)
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Cote d'Ivoire (Ivory Coast)
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- France
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- French Polynesia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Gabon
  - Web
    - 2013 10K
    - 2013 30K
- Guadeloupe
  - Web
    - 2014 10K
    - 2014 30K
- Haiti
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Luxembourg
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2012 10K
    - 2012 30K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Madagascar
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Mali
  - Web
- Martinique
  - Web
    - 2016 10K
- Monaco
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- New Caledonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Niger
  - Web
    - 2013 10K
- Reunion
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Rwanda
  - Web
    - 2013 10K
    - 2013 30K
- Senegal
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
- Switzerland
  - Web
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- Togo
  - Web
    - 2013 10K
- Tuvalu
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Friulian
- Wikipedia
  - 2018 10K
Galician
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Ganda
- Newscrawl
  - 2013 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2018 10K
  - 2021 10K
Georgian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Georgia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
German
- News
  - 1995 10K
  - 1995 30K
  - 1995 100K
  - 1995 300K
  - 1996 10K
  - 1996 30K
  - 1996 100K
  - 1996 300K
  - 1997 10K
  - 1997 30K
  - 1997 100K
  - 1997 300K
  - 1998 10K
  - 1998 30K
  - 1998 100K
  - 1998 300K
  - 1999 10K
  - 1999 30K
  - 1999 100K
  - 1999 300K
  - 2000 10K
  - 2000 30K
  - 2000 100K
  - 2000 300K
  - 2001 10K
  - 2001 30K
  - 2001 100K
  - 2001 300K
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2003 10K
  - 2003 30K
  - 2003 100K
  - 2003 300K
  - 2004 10K
  - 2004 30K
  - 2004 100K
  - 2004 300K
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2010 1M
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2012 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2010 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Austria
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Belgium
  - Web
    - 2013 10K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Germany
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- Hungary
  - Web
    - 2013 10K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- Liechtenstein
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Luxembourg
  - Web
    - 2013 10K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2021 10K
    - 2021 30K
    - 2021 100K
    - 2021 300K
- Namibia
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
  - Web
    - 2013 10K
    - 2013 30K
    - 2017 10K
    - 2017 30K
    - 2019 10K
    - 2019 30K
    - 2019 100K
- Poland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Switzerland
  - Newscrawl
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
Gilaki
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2016 10K
Goan Konkani
- Newscrawl
  - 2011 10K
  - 2011 30K
- Wikipedia
Guarani
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Gujarati
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2014 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Haitian
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2012 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
- Haiti
  - Web
Hausa
- Wikipedia
  - 2021 10K
  - 2021 30K
Hebrew
- News
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Hindi
- News
  - 2007 10K
  - 2007 30K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Hungarian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- COM
  - Web
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Hungary
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
- Romania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Slovakia
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Icelandic
- News
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Iceland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Ido
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Igbo
- Wikipedia
  - 2021 10K
Iloko
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Indonesian
- News
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-tufs5
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-tufs6
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Brunei
  - Web
    - 2015 10K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
Interlingua
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Interlingue
- Wikipedia
  - 2018 10K
  - 2021 10K
Iranian Persian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Iran
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Irish
- Newscrawl
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Italian
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2009 10K
  - 2005-2009 30K
  - 2005-2009 100K
  - 2005-2009 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 100K
  - 2012 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- San Marino
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Switzerland
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
    - 2023 10K
    - 2023 30K
    - 2023 100K
    - 2023 300K
Japanese
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2005-2008 10K
  - 2005-2008 30K
  - 2005-2008 100K
  - 2005-2008 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2021 10K
  - 2023 10K
  - 2023 30K
  - 2023 100K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- Japan
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Javanese
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- BMS
  - Wikipedia
    - 2016 10K
    - 2021 10K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
Kabiyè
- Wikipedia
  - 2018 10K
  - 2021 10K
Kalaallisut
- Newscrawl
  - 2011 10K
  - 2011 30K
- Greenland
  - Web
    - 2014 10K
    - 2014 30K
Kannada
- Newscrawl
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Karachay-Balkar
- Wikipedia
Kashubian
- Wikipedia
Kazakh
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Kazakhstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Kirghiz
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Komi
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Komi-Permyak
- Wikipedia
Konkani
- India
  - Web
    - 2015 10K
Korean
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Korea, South
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Kurdish
- Newscrawl
  - 2011 10K
  - 2011 30K
Kölsch
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Ladino
- Wikipedia
  - 2018 10K
  - 2021 10K
Latin
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Latvian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Latvia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Lezghian
- Wikipedia
  - 2018 10K
Ligurian
- Wikipedia
  - 2021 10K
Limburgan
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Netherlands
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Lithuanian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- LIT
  - News
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lithuania
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Lombard
- Wikipedia
  - 2010 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Low German
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Netherlands
  - Wikipedia
    - 2016 10K
    - 2021 10K
Lower Sorbian
- Wikipedia
  - 2016 10K
  - 2018 10K
Lushai
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2015 10K
    - 2015 30K
Luxembourgish
- Newscrawl
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Luxembourg
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Macedonian
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Macedonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Madurese
- Indonesia
  - Web
    - 2013 10K
Maithili
- Wikipedia
  - 2018 10K
  - 2021 10K
Malagasy
- Web
  - 2012 10K
  - 2012 30K
- Wikipedia
Malay
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Newscrawl-tufs5
  - 2011 10K
- Newscrawl-tufs6
  - 2012 10K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
- Malaysia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
Malayalam
- Newscrawl
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Maltese
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2012 10K
  - 2012 30K
  - 2012 100K
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2012 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Mandarin Chinese
- Wikipedia
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- China, Republic of (Taiwan)
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
- TRAD
  - Wikipedia
    - 2018 10K
    - 2018 30K
Manx
- Wikipedia
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Maori
- Web
- New Zealand
  - Web
    - 2013 10K
    - 2013 30K
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Marathi
- News
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Mazanderani
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Min Nan Chinese
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
Minangkabau
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Indonesia
  - Web
    - 2013 10K
Mingrelian
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Mirandese
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Modern Greek
- News
  - 2007 10K
  - 2007 30K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Greece
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Mongolian
- News
  - 2011 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Navajo
- Wikipedia
  - 2018 10K
  - 2021 10K
Neapolitan
- TARA
  - Wikipedia
    - 2021 10K
Nepali
- News
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Nepal
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Newari
- Wikipedia
  - 2009 10K
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
North Azerbaijani
- Wikipedia
  - 2007 10K
- Azerbaijan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Northern Frisian
- Wikipedia
Northern Sami
- Wikipedia
  - 2018 10K
  - 2021 10K
- Norway
  - News
    - 2015 10K
  - Web
    - 2013 10K
Northern Uzbek
- Uzbekistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Norwegian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Norwegian Bokmål
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Newscrawl
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
- Norway
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Norwegian Nynorsk
- Newscrawl
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Norway
  - Web
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Occitan
- Wikipedia
  - 2007 10K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- France
  - Web
    - 2020 10K
Oriya
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Oromo
- Wikipedia
  - 2021 10K
Ossetian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Pampanga
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
Panjabi
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
Papiamento
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2016 10K
  - 2016 30K
Pedi
- South Africa
  - Web
    - 2018 10K
    - 2020 10K
Persian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2012 10K
  - 2012 30K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
- Iran
  - Web
Pfaelzisch
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Piemontese
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Plateau Malagasy
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Polish
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- COM
  - Web
    - 2018 10K
    - 2018 30K
    - 2018 100K
    - 2018 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Portuguese
- News
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Brazil
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Cape Verde
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- European Union
  - Web
- Luxembourg
  - Web
- Macau
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Mozambique
  - Web
- Netherlands Antilles
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Portugal
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Pushto
- News
- Newscrawl
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Quechua
- Wikipedia
  - 2011 10K
  - 2012 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Romanian
- News
  - 1998-2007 10K
  - 1998-2007 30K
  - 1998-2007 100K
  - 1998-2007 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Moldova
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Romania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Romansh
- Newscrawl
  - 2016 10K
  - 2016 30K
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Switzerland
  - Web
    - 2015 10K
    - 2016 10K
    - 2016 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Russian
- News
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Newscrawl-public
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Azerbaijan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Estonia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Georgia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- Kazakhstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Kyrgyzstan
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Latvia
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Lithuania
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Moldova
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- SU
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Tajikistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Tuvalu
  - Web
    - 2015 10K
    - 2015 30K
- Ukraine
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Uzbekistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Rusyn
- Wikipedia
  - 2018 10K
  - 2021 10K
- Ukraine
  - Web
    - 2016 10K
Sami
- News
  - 2020 10K
Samogitian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Sanskrit
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Sardinian
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Saterfriesisch
- Wikipedia
  - 2018 10K
Scots
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
Serbian
- News
  - 2019 10K
  - 2019 30K
  - 2020 10K
  - 2022 10K
  - 2022 30K
  - 2023 10K
  - 2023 30K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bosnia and Herzegovina
  - Web
- Montenegro
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Serbia
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Serbo-Croatian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bosnia and Herzegovina
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2014 10K
    - 2014 30K
    - 2014 100K
- Croatia
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2007 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- European Union
  - Web
- Serbia
  - News
    - 2007 10K
  - Newscrawl
    - 2011 10K
    - 2011 30K
    - 2011 100K
    - 2011 300K
    - 2012 10K
    - 2012 30K
    - 2012 100K
    - 2012 300K
  - Wikipedia
    - 2007 10K
    - 2007 30K
    - 2007 100K
    - 2007 300K
    - 2010 10K
    - 2010 30K
    - 2010 100K
    - 2010 300K
Shona
- Web
  - 2012 10K
  - 2012 30K
- Zimbabwe
  - Newscrawl
    - 2013 10K
    - 2013 30K
  - Web
    - 2013 10K
    - 2015 10K
    - 2016 10K
    - 2016 30K
    - 2018 10K
    - 2018 30K
    - 2018 100K
Sicilian
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Silesian
- Wikipedia
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
Sindhi
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Sinhala
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Slovak
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Slovakia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Slovenian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
- Slovenia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
Somali
- News
  - 2020 10K
- Newscrawl
- Wikipedia
Southern Sotho
- South Africa
  - Web
    - 2015 10K
    - 2018 10K
Spanish
- News
  - 2001-2002 10K
  - 2001-2002 30K
  - 2001-2002 100K
  - 2001-2002 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2008 10K
  - 2008 30K
  - 2008 100K
  - 2008 300K
  - 2009 10K
  - 2009 30K
  - 2009 100K
  - 2009 300K
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
  - 2024 10K
  - 2024 30K
  - 2024 100K
  - 2024 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2017 10K
  - 2017 30K
  - 2017 100K
  - 2017 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Newscrawl-public
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
- Web
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Andorra
  - Web
    - 2013 10K
    - 2013 30K
    - 2017 10K
    - 2017 30K
    - 2017 100K
- Argentina
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Bolivia
  - Web
    - 2015 10K
- Colombia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Costa Rica
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Cuba
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Dominican Republic
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Ecuador
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- El Salvador
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Guatemala
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Honduras
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Mexico
  - Web
    - 2002 10K
    - 2002 30K
    - 2002 100K
    - 2002 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Nicaragua
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
- Panama
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Paraguay
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Peru
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Puerto Rico
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- United States
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Uruguay
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Venezuela
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
Standard Estonian
- Web
  - 2011 10K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Standard Latvian
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Standard Malay
- Newscrawl-tufs15
Sundanese
- Wikipedia
  - 2007 10K
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Indonesia
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
Swahili
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
- Wikipedia
  - 2010 30K
  - 2011 10K
  - 2011 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Swati
- South Africa
  - Web
    - 2020 10K
Swedish
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2006 10K
  - 2006 30K
  - 2006 100K
  - 2006 300K
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2002 10K
  - 2002 30K
  - 2002 100K
  - 2002 300K
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2007 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
- Sweden
  - Web
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Swiss German
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Switzerland
  - Web
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2017 10K
    - 2017 30K
    - 2017 100K
Tagalog
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
- Wikipedia
  - 2007 10K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Tajik
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
- Tajikistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
- Uzbekistan
  - Web
    - 2015 10K
Tamil
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2020 10K
  - 2020 30K
  - 2020 100K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Sri Lanka
  - Web
    - 2020 10K
    - 2020 30K
    - 2020 100K
    - 2020 300K
Tatar
- News
- Web
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Telugu
- News
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Thai
- Newscrawl
  - 2011 10K
  - 2011 30K
- Wikipedia
  - 2016 10K
- Thailand
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2016 10K
    - 2016 100K
Tosk Albanian
- Wikipedia
  - 2007 10K
  - 2007 30K
- Albania
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2017 10K
    - 2017 30K
    - 2017 100K
    - 2017 300K
- SQI
  - News
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Tsonga
- South Africa
  - Web
    - 2018 10K
    - 2020 10K
Tswana
- Botswana
  - Web
    - 2018 10K
- South Africa
  - Web
    - 2020 10K
Tulu
- Wikipedia
  - 2018 10K
Turkish
- News
  - 2005 10K
  - 2005 30K
  - 2005 100K
  - 2005 300K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Bulgaria
  - Web
    - 2015 10K
    - 2015 30K
- Cyprus
  - Web
- European Union
  - Web
    - 2014 10K
    - 2014 30K
- Turkey
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2016 10K
    - 2016 30K
    - 2016 100K
    - 2016 300K
    - 2019 10K
    - 2019 30K
    - 2019 100K
    - 2019 300K
Turkmen
- Wikipedia
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
- Turkmenistan
  - Web
    - 2015 10K
    - 2015 30K
    - 2016 10K
    - 2016 30K
    - 2016 100K
Tuvinian
- Wikipedia
Udmurt
- Wikipedia
  - 2016 10K
  - 2018 10K
Uighur
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Ukrainian
- News
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
  - 2023 10K
  - 2023 30K
  - 2023 100K
  - 2023 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2011 1M
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
- Web
  - 2012 10K
  - 2012 30K
  - 2012 100K
  - 2012 300K
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2010 100K
  - 2010 300K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- European Union
  - Web
- Ukraine
  - Web
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
    - 2019 100K
    - 2019 300K
Upper Sorbian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
Urdu
- News
  - 2007 10K
  - 2007 30K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
  - 2019 10K
  - 2020 10K
  - 2020 30K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2012 10K
  - 2012 30K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2015 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- India
  - Web
    - 2014 10K
    - 2014 30K
    - 2015 10K
    - 2015 30K
    - 2015 100K
- Pakistan
  - Newscrawl
    - 2012 10K
Uzbek
- News
  - 2020 10K
  - 2020 30K
- Newscrawl
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Venda
- South Africa
  - Web
    - 2020 10K
Venetian
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2018 10K
  - 2021 10K
  - 2021 30K
- Brazil
  - Web
    - 2015 10K
    - 2015 30K
- Croatia
  - Web
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2015 10K
    - 2015 30K
    - 2015 100K
Vietnamese
- News
  - 2007 10K
  - 2007 30K
  - 2019 10K
  - 2019 30K
  - 2019 100K
  - 2019 300K
  - 2020 10K
  - 2020 30K
  - 2020 100K
  - 2020 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2022 10K
  - 2022 30K
  - 2022 100K
  - 2022 300K
- Newscrawl
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2011 300K
  - 2013 10K
  - 2013 30K
  - 2013 100K
  - 2013 300K
  - 2013 1M
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2007 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
- Cambodia
  - Web
    - 2013 10K
- Vietnam
  - Web
    - 2013 10K
    - 2013 30K
    - 2013 100K
    - 2013 300K
    - 2014 10K
    - 2014 30K
    - 2014 100K
    - 2014 300K
    - 2015 10K
    - 2015 30K
    - 2015 100K
    - 2015 300K
Vlaams
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Volapük
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Võro
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Walloon
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Waray (Philippines)
- Wikipedia
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2014 300K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2016 300K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
Welsh
- Wikipedia
  - 2007 10K
  - 2007 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Western Frisian
- News
- Newscrawl
  - 2014 10K
  - 2014 30K
  - 2014 100K
  - 2015 10K
  - 2015 30K
  - 2015 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
- Wikipedia
  - 2011 10K
  - 2011 30K
  - 2011 100K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2018 300K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Western Mari
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Western Panjabi
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2016 100K
  - 2018 10K
  - 2018 30K
  - 2018 100K
  - 2021 10K
  - 2021 30K
  - 2021 100K
  - 2021 300K
Wu Chinese
- Wikipedia
  - 2010 10K
  - 2014 10K
  - 2016 10K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Xhosa
- South Africa
  - Web
    - 2015 10K
    - 2018 10K
    - 2018 30K
    - 2020 10K
    - 2020 30K
Yakut
- Wikipedia
  - 2010 10K
  - 2011 10K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
  - 2021 100K
Yiddish
- Wikipedia
  - 2010 10K
  - 2010 30K
  - 2014 10K
  - 2014 30K
  - 2016 10K
  - 2016 30K
  - 2018 10K
  - 2018 30K
  - 2021 10K
  - 2021 30K
Yoruba
- Wikipedia
Yue Chinese
- Wikipedia
Zeeuws
- Wikipedia
  - 2014 10K
  - 2016 10K
  - 2018 10K
  - 2021 10K
Zulu
- Mixed
  - 2014 100K
- News
  - 2013 10K
  - 2013 30K
- Web
  - 2012 10K
  - 2013 10K
  - 2013 30K
  - 2013 100K
- South Africa
  - Web
    - 2013 10K
    - 2015 10K
    - 2015 30K
    - 2018 10K
    - 2018 30K
    - 2020 10K
    - 2020 30K
    - 2020 100K

4.3.1.1 Most Frequent Sentence Beginnings I

Words

Zipf's diagram for words at sentence beginnings

Gnuplot diagram

Rank	Count	Beginning
20474	5005	Бұл
82259	2789	Сондай-ақ,
12149	2122	Ашылуы
65223	2098	Ол
73222	1756	Осы
70914	1300	Оның
65492	1239	Олар
86124	1042	Сонымен
63379	853	Өзен
6662	837	Ал
85363	686	Сондықтан
17770	669	Бірақ
30644	629	Егер
66033	615	Олардың
1618	612	2006
44745	607	Қазіргі
32673	601	Елді
81237	500	Сол
42978	497	Қазақ
60810	492	Мысалы,
59480	442	Мұндай
43287	334	Қазақстан
6744	314	Алайда
34491	314	Әр
17749	294	Бір
57075	289	Мемлекет
4799	280	Адам
1266	263	2001
59280	259	Мұнда
43335	247	Қазақстанда

522 msec needed at 2021-04-19 00:06